Markov decision process - PDFSEARCH.IO - Document Search Engine

Markov decision process
Results: 537

#	Item
61	Stat 260/CSLearning in Sequential Decision Problems. Peter Bartlett 1. Recall: MDPs. 2. Value iteration. 3. Policy iteration. Add to Reading List Source URL: www.stat.berkeley.edu Language: English - Date: 2014-11-25 12:45:38 Markov processes Mathematics Probability theory Mathematical analysis Dynamic programming Markov decision process Stochastic control Markov chain Mathematical optimization Distribution
62	Classification-based Policy Iteration with a Critic V. Gabillon1 , A. Lazaric1 , M. Ghavamzadeh1 & B. Scherrer2 1 2 INRIA Lille - Nord Europe, Team Sequel, Add to Reading List Source URL: victorgabillon.nfshost.com Language: English - Date: 2011-06-30 11:49:57 Dynamic programming Markov decision process Stochastic control Probability theory Probability Statistics
63	LETTER doi:nature14236 Human-level control through deep reinforcement learning Add to Reading List Source URL: storage.googleapis.com Language: English - Date: 2016-01-26 06:53:21 Artificial intelligence Machine learning Computational neuroscience Applied mathematics Cybernetics Q-learning Artificial neural networks Reinforcement learning Convolutional neural network DQN Markov decision process Supervised learning
64	MDP Cheatsheet Reference Author: John Schulman (F) = facts that are a bit more technical 1 Markov Decision Process Add to Reading List Source URL: rll.berkeley.edu Language: English - Date: 2016-01-25 13:14:56
65	Stat 260/CSLearning in Sequential Decision Problems. Peter Bartlett 1. Markov decision processes and partially observable Markov decision processes. 2. Value functions, Q functions. Add to Reading List Source URL: www.stat.berkeley.edu Language: English - Date: 2014-11-25 12:45:37 Markov processes Dynamic programming Probability theory Stochastic control Mathematical analysis Probability Markov models Markov decision process Mathematical optimization Markov chain Bellman equation X0
66	arXiv:1402.6763v1 [math.OC] 27 FebLinear Programming for Large-Scale Markov Decision Problems Yasin Abbasi-Yadkori Queensland University of Technology Add to Reading List Source URL: arxiv.org Language: English - Date: 2014-02-27 20:30:05 Mathematics Mathematical analysis Dynamic programming Markov decision process Stochastic control Distribution Probability theory Jet bundle Table of stars with Bayer designations
67	Deterministic MDPs with Adversarial Rewards and Bandit Feedback Raman Arora TTIC 6045 S. Kenwood Ave. Chicago, IL 60637, USA Add to Reading List Source URL: dept.stat.lsa.umich.edu Language: English - Date: 2012-09-12 18:50:24 Markov models Markov processes Stochastic optimization Mathematical optimization Operations research Reinforcement learning Markov decision process Algorithm Multi-armed bandit Dynamic programming Shortest path problem PP
68	Rollout Allocation Strategies for Classification-based Policy Iteration Victor Gabillon Alessandro Lazaric Add to Reading List Source URL: victorgabillon.nfshost.com Language: English - Date: 2010-07-01 09:47:14 Mathematics Mathematical analysis Artificial intelligence Backgammon Rollout Markov decision process Multi-armed bandit Reinforcement learning Inverted pendulum Pendulum Prime-counting function Valuation
69	Playing Atari with Deep Reinforcement Learning Volodymyr Mnih Koray Kavukcuoglu Add to Reading List Source URL: arxiv.org Language: English - Date: 2013-12-19 20:23:45 Artificial intelligence Computational neuroscience Machine learning Learning Artificial neural networks Cybernetics Q-learning Reinforcement learning Deep learning Markov decision process Feature learning Temporal difference learning
70	approximate-mdps-notes.dvi Add to Reading List Source URL: www.stat.berkeley.edu Language: English - Date: 2014-11-25 12:45:37 Operations research Numerical analysis Mathematical optimization Mathematical analysis Optimal control Dynamic programming Markov decision process Stochastic control